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(57) Abstract 




Disclosed is a method for character spacing in text recognition tasks, wherein the possible intersecting points of extraction objects 
being examined are detected by means of white space and angular analysis. Plausible spacing lines are determined on the basis of the 
intersecting points and the corresponding counterpoints. The objects thus spaced undergo a classification process, final spacing bein<* 
determined by the results thereof. & 



(57) Zusammenfassung 

Es wird ein Verfahren zur Zeichentrennung bei Texterkennungsaufgaben angegeben, bei dem zu den untersuchten Extraktionsobjekten 
mittels WeiBdellenanalyse und Winkelanalyse mdgliche Schnittpunkte ermittelt werden, daB aus den Schnittpunkten und entsprechenden 
Gegenpunkten plausible Trennlinien ermittelt werden und daB die solcherart getrennten Objekte Klassifikations verfahren unterzogen werden 
und auf der Grundlage der Ergebnissedie endgiiltige Trennung erfolgt. 



LED1GLICH ZUR INFORMATION 

Codes zur Identifizierung von PCT-Vertragsstaaten auf den Kopfbogen der Schriften, die internationale Anmeldungen gemass dem 
PCT veroffentlichen. 



AL 


Albanicn 


ES 


Span ien 


LS 


Lesotho 


SI 


Slowenien 


AM 


Armenicn 


FI 


Finn land 


LT 


Litauen 


SK 


Slowakei 


AT 


Osterreich 


FR 


Frankreich 


LU 


Luxemburg 


SN 


Senegal 


AU 


Austral ien 


GA 


Gabun 


LV 


Leuland 


SZ 


Swasiland 


AZ 


Aserbaidschan 


GB 


Vereinigtes Kfinigreich 


MC 


Monaco 


TD 


Tschad 


BA 


Bosnien-Herzcgowina 


GE 


Georgicn 


MD 


Republik Moldau 


TG 


Togo 


BB 


Barbados 


GH 


Ghana 


MG 


Madagaskar 


TJ 


Tadschikistan 


BE 


Betgien 


GN 


Guinea 


MK 


Die ehemalige jugoslawische 


TM 


Turkmenistan 


BF 


Burkina Faso 


GR 


Griechenland 




Republik Mazedonien 


TR 


TQrkei 


BG 


Bulgarten 


HU 


Ungam 


ML 


Mali 


TT 


Trinidad und Tobago 


BJ 


Benin 


IE 


Irland 


MN 


Mongolei 


UA 


Ukraine 


BR 


Brasilien 


IL 


Israel 


MR 


Mauretanien 


UG 


Uganda 


BY 


Belarus 


IS 


Island 


MW 


Malawi 


US 


Vereinigte Staaten von 


CA 


Kanada 


IT 


Italien 


MX 


Mexiko 




Amerika 


CF 


Zentralafrikamsche RepubHk 


JP 


Japan 


NE 


Niger 


uz 


Usbekistan 


CC 


Kongo 


KE 


Kenia 


NL 


Niederlajide 


VN 


Vietnam 


CH 


Schweiz 


KG 


Kirgisistan 


NO 


Norwegen 


YU 


Jugoslawten 


CI 


Cdte d'lvoire 


KP 


Demokratische Volksrepublik 


NZ 


Neuseeland 


zw 


Zimbabwe 


CM 


Kamerun 




Korea 


PL 


Polen 






CN 


China 


KR 


Republik Korea 


PT 


Portugal 






CU 


Kuba 


KZ 


Kasachstan 


RO 


Rumanien 






CZ 


Tschechische Republik 


LC 


St. Lucia 


RU 


Russische Federal ion 






DE 


Deutschland 


LI 


Liechtenstein 


SD 


Sudan 






DK 


D&nemark 


LK 


SH Lanka 


SE 


Schweden 






EE 


Estland 


LR 


Liberia 


SG 


Singapur 







WO 00/19359 



PCT/EP99/0684I 



Verfahren zur Zeichent rennung bei Texter kennungsauf gaben 

Die Erfinclung betrifft ein Verfahren zur Zeichent rennung bei 
Texter kennungsauf gaben . 

5 

Bei der automatischen Erkennung von Texten, d.h. bei der 
Umwandlung der grafischen Information eines Dokumentes in 
Textzeichen, die mittels elektronischen Textverarbeitungs- 
programmen weiterverarbei tet werden konnen, ist eine 

10 wesentliche Vorausset zung fur einen er f olgreichen 

Erkennungsvorgang die genaue Bestimmung der Lage und der 
Grofie der einzelnen Zeichen. Diese Bestimmung ist bei 
Vorlagen mit schlechtem Schriftbild oder Schriftarten mit 
sehr engem Zeichenabstand unter anderem dadurch 

15 problematisch, daft die Zeichen mit einander verbunden sind 
„zusammenwachsen" und damit durch herkommliche Methoden wie 
die einfache Konturverf olgung nicht mehr getrennt werden 
konnen . 

20 Der Erfindung liegt daher die Aufgabe zugrunde, ein 

verbessertes Verfahren zur Trennung miteinander verbundener 
Zeichen anzugeben. 

Dies geschieht er f indungsgemaft mit einem Verfahren der 
25 eingangs genannten Art, bei dem zu den untersuchten 
Extraktionsobjekten mittels WeiBdellenanalyse und 
Winkelanalyse mogliche Schnittpunkte ermittelt werden, bei 
dem aus den Schnittpunkten und entsprechenden Gegenpunkten 
plausible Trennlinien ermittelt werden und bei dem die 
30 solcherart getrennten Objekte Klassif ikationsverf ahren 

unterzogen werden und auf der Grundlage der Ergebnisse die 
endgultige Trennung erfolgt. 

35 Vorteilhaft ist eine Ausgestal tung des Verfahrens in der 

Weise, daB bei mehr als drei moglichen Schnittpunkten , ein 
erster Schnitt durch den vom linken Zeichenanf ang gezahlten 
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vierten Schnittpunkt erfolgt. Dies deswegen, weil kein 
ubliches Textzeichen der lateinischen Schrift mehr als drei 
Weiftdel len auf weist . 

5 Giinstig ist es ferner, wenn nach einem ersten Schnitt mit 

einem ersten moglichen Schnittpunkt und einem darauf f olgenden 
erfolglosen Klassif ikat ionsversuch als Basis fur einen 
weiteren Trennversuch der zum ersten moglichen Schnittpunkt 
nachstliegende linke Nachbarschnittpunkt vorgesehen wird. 

10 

Die Erfindung wird anhand von Figuren naher erlautert. 
Es zeigen beispielhaf t : 

Fig.l eine Darstellung zur Weiftdellenanalyse eines Bildes, 
Fig. 2 eine Darstellung zur eigentlichen Zeichentrennung . 

15 

Der Ablauf des erf indungsgemafien Verfahrens ist wie folgt: 

Das Verfahren wird im Erkennungsvorgang nach der Bestimmung 
der Lage der Zeile gestartet. Bei der Ermittlung des Umfanges 
20 eines Zeichens Oder mehrerer verbundener Zeichen durch 
Konturverf olgung wird bereits eine Weiftdellenanalyse 
durchgef uhrt . Nach dem Vorliegen der vollstandigen Kontur 
erfolgt eine Winkelanalyse. 

25 Mittels Weiftdellenanalyse und Winkelanalyse werden mogliche 
Schnittpunkte ermittelt, die in Verbindung mit Gegenpunkten 
mogliche Trennlinien liefern. 

Die Schnittpunkte werden hinsichtlich ihrer Plaus ibilitat 
30 untersucht . Dabei wird ermittelt, welche Zeichenf olgen die 
vorliegende Weiftdellenkombinat ion beinhalten. So sind 
beispielsweise in der Buchstabenf olge WV folgende Weifidellen 
enthalten OBEN-UNTEN-OBEN-UNTEN-OBEN . Wobei OBEN ( UNTEN ) eine 
nach oben (unten) offene Weifidelle kennzeichnet . Aus der 
35 Kenntnis der Buchstaben heraus wird nun die erste Trennung 
durch den Schnittpunkt der vierten Weiftdelle erfolgen. 
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Darauf wird ermittelt, inwieweit die Trennung des Objekts 
entlang der auf plausiblen Schnittpunkten beruhenden 
Trennlinien zu plausiblen Klassif ikationsergebnissen fuhrt. 
Mit anderen Worten, die getrennten Zeichen oder Zeichenteile 
5 werden einem Er kennungsvorgang z.B. mittels neuronalem Netz 
unterworfen und wenn dieser Vorgang zu einem 
zuf riedenstellenden Ergebnis - einem mit hoher Sicherheit 
erkannten Zeichen - fuhrt, dann wird die Trennung akzeptiert. 
Andernfalls wird die Trennung entlang von anderen Trennlinien 
10 solange wiederholt, bis ein zuf riedenstellendes Ergebnis 
vorliegt . 

Neuronale Netze sind mathemat ische Modelle, welche dem Aufbau 
des menschlichen Gehirns nachempf unden sind, Sie bestehen aus 

15 Neuronen, das sind im wesentlichen Summierelemente mit 
gewichteten Eingangen und einem nicht linearen 
Verstarkeranteil, die zu einem parallelen Netzwerk mit 
typisch zwei Ebenen zusammengef afit werden. Eine ausfuhrliche 
Beschreibung des beim Ausf uhrungsbeispiel eingesetzten 

20 ^Feedforward Neural Networks" findet sich beispielsweise in 
^Layered Neural Nets for Pattern Recognition", B . Widrow, R. 
G. Winter, R. A. Baxter; IEEE Transactions on Acoustics,, 
Speech and Signal Processing, Vol. 36. No. 7. July 88. 

25 Die Mustererkennung mitties neuronalem Netz erfolgt nach dem 
in „A rotation, scaling, and translation invariant pattern 
classification system", C. Yuceer, K Oflazer; Pattern 
Recognition, Vol. 26, No5, pp687-710, 1993. beschr iebenen 
Verf ahren . 

30 

Die Weiftdellenanalyse wird anhand der Figur 1 naher 
beschrieben. Die Figur zeigt die beiden miteinander 
verbundenen Buchstaben r und f die eine Weiftdelle W 
aufweisen. Unter Weiftdelle W wird dabei ein von drei Seiten 
35 begrenzter weifcer Zwischenraum verstanden, der eine gewisse 
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Tiefe aufweist und dessen offene Seite nach oben oder unten 
gerichtet ist. Ermittelt wird diese Weiftdelle W bei der 
Verfolgung der Kontur des ( zusammengewachsenen ) Zeichens wenn 
die Konturlinie C zwei vorgegebene Schwellwerte SW in beiden 
Richtungen uberschreitet . Liegt wie in dem Beispiel eine nach 
unten offene Weiftdelle W vor, dann wird der hochste Punkt der 
Konturlinie C als moglicher Schnittpunkt S definiert, bei 
einer nach oben offenen Weiftdelle ist dies der tiefste Punkt. 

Der Ablauf der daraufhin erfolgenden Winkelanalyse ist wie 
f olgt : 

Aus jeweils drei Punkten der Konturlinie C[i] werden zwei 
Vektoren ermittelt, fur die gilt: 

A = c[i]C[i-5] und B = c[i]C[i + 5] 

Der Winkel zwischen den beiden Vektoren wird berechnet. Ist 
dieser linkslaufig, mit einem Betrag kleiner als 80° und 
einer entweder nach oben oder nach unten weisenden Spitze 
(C[i]), dann wird der Winkel in eine Liste eingetragen. 

Ist diese Bedingung fur mehrere nebeneinander liegende 
Vektorpaare erfullt, dann wird nur der Winkel mit dem 
geringsten Betrag weiterverf olgt . 

Die in der Liste eingetragenen Winkel werden nun daraufhin 
untersucht, ob auf der gegenuber 1 iegenden Seite der 
Konturlinie ein Winkel mit entgegengeset zter Orientierung der 
Spitze vorhanden ist. Ist dies der Fall, dann wird das 
daraufhin gebildete Winkelpaar als Position eines moglichen 
Schnittpunktes gespeichert . 
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Im Folgenden der Ablauf bei der Best immung des Winkels 
zwischen zwei Vektoren, die durch 3 Punkte aus der 
Konturlinie (d:xl/yl, C 6 :x2/y2, C u :mx/my) def iniert . 
Daraus werden die x und y Komponenten der beiden Vektoren 
ermittelt . 

Ax = x\-mx . Ay = y\-my . Bx = x2-mx . By = y2-mx 
r f * * 

Der Winkel zwischen den Vektoren A und B wird wie folgt 
berechnet: Zuerst wird der Winkel von A zur x-Achse und dann 
der Winkel B zur x-Achse ermittelt. 

Ax 

Winkel = arccos( — . ,~ — . ) 



Winkel = 360-winkelB+winkelA (ist Winkel- groiier 360°, dann 
wird der Winkel urn 360° korrigiert) 

Die Bestimmung der Winkelspit zenrichtung beruht auf der 
Uberlegung, daft bei einer nach unten gerichteten Spitze die 
Y-Koordinaten der Punkte Ci und C 6 kleiner als die Y- 
Koordinate von Cu sind, 

Bei einer nach oben gerichteten Spitze mussen hingegen die Y- 
Koordinaten der Punkte Ci und C 6 grofier als die Y-Koordinate 
von Cu sein. 

Die Eigenheiten gedruckter Texte und der Einflufi der 
begrenzten Bildauf losung bringen es mit sich, daft im Bereich 
eines Knicks der Kontur eines Zeichens die in der 
beschriebenen Weise ermittelten Winkel zuwischen 2 Vektoren 




Winkel (inGrad) — 



Winkel (inRad) * 1 80 
Pi 
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abhangig vom Betrachtungsraum zuerst zunehmend kleiner werden 
und danach wieder kont inuierlich zunehmen. Fur die weitere 
Auswertung wird daher nur der jeweils minimale Winkel eines 
derartigen Bereiches verwendet. 

Zur Festlegung einer moglichen Trennlinie muft nun zu jedem 
moglichen Schnittpunkt C(Nr) ein entsprechender Gegenpunkt 
auf dem gegenuberliegenden Zweig der Konturlinie 
C (i) ; i= (0, . , contourNr) ermittelt werden. 

Dazu wird eine Gerade durch zwei auf der Konturlinie dem 
moglichen Schnittpunkt C(Nr) benachbarte Punkte C(Nr-l) und 
C(Nr+l) gelegt, und zu dieser Geraden die Normale ermittelt. 
Die zu dem Schnittpunkt dieser Normalen mit dem 
gegenuberliegenden Zweig der Konturlinie benachbarten Punkte 
werden hinsichtlich ihres Abstandswertes zum moglichen 
Schnittpunkt und der Normalen untersucht und der Konturpunkt 
mit dem minimalen Abstandswert als Gegenpunkt C(g)und damit 
als zweiter Punkt der moglichen Trennlinie definiert. 
Dei mathematische Definition dieses Vorganges lautet: 

nx = C(Nr + \)x -C(Nr-\)x 
ny = C(Nr 4- l)y - C(Nr - \)y 



Abstand 




= obs 



nx * (C(i)x - C{Nr)x) + ny * (C(i)y - C(Nr)y) 



Abstand zu g2 




Abstandswert = Abstand + Abstand zu g2; 



C(g) = C(i)| Abstandswert (C (g) , C(Nr))= min 
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Die eigentliche Trennung wird anhand der Fig. 2 erlautert: 
Basis der Trennung ist die Konturlinie der ext rahierten 
Zeichen. In einem 1. Schritt wird ein Trennlinienpuf f er mit 0 
initial isiert , dies entspricht einer senkrechten Linie am 
5 linken Rand, danach wird der am weitesten rechts liegende 
Punkt der Konturlinie 1 zwischen 0 und dem der Trennung 
zugrundeliegenden Schnitt punkt (das X- Wert -Maximum) 
ermittelt. Ebenso werden der am weitesten rechts liegende 
Punkt des Zweiges (das x-Wert Maximum) der Konturlinie vom 
10 Gegenpunkt bis zum Ende der Kontur 2 und der Trennlinie 3 
ermittelt . 

Die gesammelten maximalen x-Werte stellen also den auliersten 
rechten Rand des zur Klassif izierung herangezogenen Zeichens 
15 dar. 
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Pa tentanspruche 

1) Verfahren zur Zeichent rennung bei Texter kennungsauf gaben , 
dadurch gekennzeichnet, daft zu den untersuchten 

5 Extraktionsobjekten mittels Weiftdellenanalyse und 

Winkelanalyse mogliche Schnittpunkte ermittelt werden, daft 
aus den Schni ttpunkten und entsprechenden Gegenpunkten 
plausible Trennlinien ermittelt werden und daft die solcherart 
getrennten Objekte Klassif ikationsverf ahren unterzogen werden 
10 und auf der Grundlage der Ergebnisse die endgultige Trennung 
erf olgt . 

2) Verfahren nach Anspruch 1, dadurch gekennzeichnet, daft bei 
mehr als drei moglichen Schnittpunkten , ein erster Schnitt 

15 durch den vom linken Zeichenanf ang gezahlten vierten 
Schnittpunkt erf olgt. 

3) Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, 
daft nach einem ersten Schnitt mit einem ersten moglichen 

20 Schnittpunkt und einem darauf f olgenden erfolglosen 
Klassif ikationsversuch als Basis fur einen weiteren 
Trennversuch der zum ersten moglichen Schnittpunkt 
nachstliegende linke Nachbarschnittpunkt vorgesehen wird. 

25 
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Fig. 1 
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